1. Datos Personales


Análisis Gráfico del Boston Housing Dataset

Preparación de los datos

En todas las secciones se emplea el Boston Housing Dataset, que contiene información de 506 distritos de Boston. Se destacan las variables lstat (% población en bajo estatus), rm (habitaciones promedio), chas (colindancia con río Charles) y medv (valor medio de vivienda en miles de dólares).

2. Dispersión Tridimensional (lstat, rm, medv)

Descripción: La dispersión tridimensional permite observar cómo interaccionan simultáneamente lstat, rm y medv, diferenciando además la proximidad al río Charles mediante chas.

Análisis: Se evidencia una fuerte relación negativa entre lstat y medv, acompañada de un efecto marginal decreciente en rangos elevados. El número de habitaciones (rm) contribuye positivamente casi de forma lineal, con ligeros indicios de rendimientos decrecientes. La variable chas añade un desplazamiento constante al alza en medv, sin alterar la forma de la superficie de datos.

3. Histograma de lstat con Curva de Densidad

Descripción: El histograma muestra la frecuencia relativa de valores de lstat, acompañado por una curva de densidad Kernel que suaviza la forma de la distribución.

Análisis: La distribución exhibe sesgo positivo, con un pico en torno al 10–12% y una larga cola hasta el 35–38%. Este patrón indica un continuum de niveles socioeconómicos, con barrios de alta pobreza como valores atípicos. La estimación por núcleos revela la necesidad de considerar transformaciones y atención a posibles heterocedasticidades en modelado.

4. Dispersión 2D (lstat vs medv) con Suavizado LOESS

Descripción: El diagrama de dispersión bidimensional muestra la relación entre lstat y medv, complementada con un ajuste semiparamétrico LOESS y diferenciación por chas.

Análisis: La curva LOESS demuestra que la sensibilidad del precio disminuye conforme aumenta lstat, con una caída inicial pronunciada seguida de un aplanamiento. Esto confirma rendimientos marginales decrecientes y respalda el uso de modelos flexibles. La proximidad al río desplaza la curva al alza de modo constante.

Conclusiones

Este análisis, fundamentado en teorías de estimación no paramétrica y regresión local, demuestra que:

El uso combinado de histogramas con densidad Kernel y diagramas de dispersión con LOESS brinda una comprensión completa del mercado de vivienda en Boston, acorde con los estándares de publicaciones de estadística aplicada de alto impacto.